Modelos Locales y Globales para RL Eficiente de Primer Orden Aprende cómo la técnica de modelos mundiales acoplados permite entrenar RL de forma eficiente sin simuladores, usando difusión y gradientes de primer orden para tareas de manipulación. 2026-06-03 · 2 min